原图看这里
识别动物 来源
这个例子中, 作者用手机拍摄了一鸟让GPT-4V 识别,GPT-4V 识别出了是 朱砂鸟。
帮我看看图上有啥?: 来源
GPT4-V 成功了识别出了,马克杯,还有马克杯上的图案。同里也识别出了,货架上的其他装饰。
技术火焰图解读: 来源
在这个例子里 GPT-4V 通过 分析一个火焰图截图,给出的代码的优化建议,找到了并行代码并发没有生效问题。
Technical Flame Graph(技术火焰图)是一种可视化工具,用于分析和优化软件程序的性能。它通过展示程序在不同时间内各个函数或代码块的执行情况,帮助开发人员识别性能瓶颈和优化机会。
火焰图以一条垂直的时间轴表示程序执行的时间,在横向则展示了各个函数或代码块的层级关系。每个函数或代码块由一个色块表示,色块的宽度表示该函数在运行过程中所占用的时间比例,颜色则可以表示其他信息,比如函数调用深度或耗时。通过观察火焰图,开发人员可以快速识别出哪些函数占用了大部分的执行时间,从而指导性能优化的工作。
火焰图通常用于分析大型软件系统的性能问题,它能够帮助开发人员理解程序的运行情况和热点,优化关键函数或代码块,并改进程序的整体性能。
示意图解读 Schematic Interpretation: 来源
下面的演示了 ChatGPT-4V 成功解读了一张来自1954年的电路图,识别出了这个电路的功能(真空电子管组成的音频放大器),以及今天要怎么做一个类似的。
解释 X 帖子 : 来源
食物建议 来源
这个例子里,原作者拍了餐厅的菜单给 GPT-4V 询问哪个菜方便外带,并有利于解酒。
网站设计的建议: 来源
原作者通过一张自己网站的截图,让GPT-4V 以产品经理的角色,给出改进建议, GPT-4V 给出的详细的建议。
画画建议 来源
原作者把自己的画给GPT-4V 看GPT4-V 给出了一些绘画建议。 给出的建议类似
深度和阴影:可以在牛眼和鼻子周围的区域加深阴影,通过增加对比度,使其呈现更立体的效果。
纹理:真实的动物毛皮通常有各种颜色和色调的短划组合。可以在面部和脖子的边缘,特别是周围,加入更多的个体毛发细节,突出毛皮的纹理。
眼睛反射:可以在牛眼中添加微妙的光反射,使其更生动和有深度。因为眼睛通常是湿润的,捕捉到微小的闪光可以增加逼真感。
背景:虽然背景不需太过详细,但可以考虑添加一些渐变阴影或柔和的阴影。这样可以给人一种深度和距离感。
草地细节:考虑在绘画中草地的划痕长度和方向上添加一些变化,并可能混合几种不同的绿色,给草地更多立体感。
耳朵质感:可以在牛耳朵的内部增加一些阴影和细节,使其更有深度,看起来更凹陷。
签名:只是一个小细节,但也许可以把签名放在一个稍微低调的位置?签名固然好,但稍微低调一些可以让观众更专注于绘画本身。
直接将Figma 截图转成代码: 来源
Adobe Lightroom 设置: 来源
原作者通过给一张实例照片,让GPT-4V 给出这张照片在 Adobe Lightroom 要用什么设置.
根据网页内容给出投放广告建议: 来源
提取驾驶证上结构化信息: 来源
结构出输出图片上的内容: 来源
医生手写字识别: 来源
Excel 公式助手: 来源
帮我找眼镜: 来源
在网上扑克游戏中给建议: 来源
在游戏中给出过关建议: 来源
小狗可爱程度评估: 来源
标注准确性识别: 来源
缩略图测试: 来源
哪个缩略图要好?
可以参考这篇技术论文:
https://arxiv.org/abs/2309.17421
这里有一份翻译:
https://card.weibo.com/article/m/show/id/2309404952763347108084
参考: https://x.com/GregKamradt/status/1711772496159252981?s=20